Рынок заведений общественного питания Москвы

Описание проекта

Инвесторы решили открыть заведение общественного питания в Москве. Таким заведением может стать кофейня.

Необходимо подготовить исследование рынка Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места. Также необходимо дать рекомендации для открытия кофейни (расположение, количество посадосных мест и т.д.)

Доступен датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года. Информация, размещённая в сервисе Яндекс Бизнес, могла быть добавлена пользователями или найдена в общедоступных источниках. Она носит исключительно справочный характер.

Описание данных

Файл moscow_places.csv:

Презентация с результатами исследования

Презентация

Table of Contents

Подключим библиотеки

Загрузим данные и изучим общую информацию

Путь к файлу: /datasets/moscow_places.csv.

Вывод.

Данные загружены. Установлено, что:

Выполним предобработку данных

Изучим, есть ли дубликаты и пропуски в данных.

Приведем к нижнему регистру значения в колонках содержащих категориальные данные name и address.

Проверим наличие дубликатов.

Полные дубликаты отсутствуют. Проверим наличие дубликатов по столбцам name и address:

Выявлено 4 строки неполных дубликатов. Посмотрим что это за дубликаты.

Выведем все пары дублирующихся строк.

Согласно данным Яндекс карт в настоящее время актуальными являютcя записи:

Удалим неактуальные записи.

Больше дубликатов не осталось.

Проверим пропущенные значения.

Достаточно большое количество пропусков в столбцах middle_coffee_cup, middle_avg_bill, price, avg_bill и seats (больше 40% значений отсутствует). менее 10% значений пропущено в столбце hours.
Заменим пропуски в столбцах с категориальными переменными (price, avg_bill и hours) на значение "нет данных". В столбцах с количественными переменными (middle_coffee_cup, middle_avg_bill и seats) замены проводить не будем.

Создадим столбец street с названиями улиц из столбца с адресом.

Создадим столбец is_24_7 с обозначением, что заведение работает ежедневно и круглосуточно (24/7).

Вывод.

Проведена предобработка данных:

Анализ данных

Категории заведений представленые в данных.

В данных представлена информация о следующих категориях (в порядке убывания количества заведений): кафе; ресторан; кофейня; бар,паб; пиццерия; быстрое питание; столовая; булочная

Исследуем количество объектов общественного питания по категориям: рестораны, кофейни, пиццерии, бары и так далее. Построим визуализации.

Самое большое количество заведений в данных - кафе. Затем идут рестораны и кофейни. Самое маленькое количество заведений типа булочная и столовая.

Исследуем количество посадочных мест в местах по категориям: рестораны, кофейни, пиццерии, бары и так далее. Построим визуализации.

Иногда количество посадочных мест в заведениях общепита может достигать 1288. Не очень понятно как можно обслужить такое количество посетителей при полной посадке. Вероятнее всего в данных ошибка.
Нормальный диапазон значений количества посадочных мест не превышает 350. Рассмотрим этот диапазон.

Самое маленькое количество посадочных мест обычно в булочных, пицериях и кафе. Медианное значение этих заведений 50-60 мест. Самое большое количество посадочных мест в ресторанах, барах и кофейнях. Медианное значение около 80-86 мест.

Рассмотрим и изобразим соотношение сетевых и несетевых заведений в датасете.

Сетевых заведений общественного питания в Москве меньше, чем несетевых. Доля сетевых - 38.1%, несетевых - 61.9%.

Выясним какие категории заведений чаще являются сетевыми.

Чаще всего сетевыми заведениями являются булочные, пиццерии и кофейни.
Реже всего - столовые и бары.

Найдем топ-15 популярных сетей в Москве.

Самое большое количество точек в Москве у сети "Шоколадница" - 120 точек. Затем идут сети пиццерий "Домино'с пицца" и "Додо пицца".
Посмотрим к какой категории заведений относятся эти сети.

Популярные сети относятся к разным категориям. 5 из 15 - кофейни ("Cofefest", "Cofix", "One price coffee", "Кофепорт" и "Шоколадница"), 3 ресторана ("Prime", "Теремок" и "Яндекс лавка") и 3 кафе ("Кулинарная лавка братьев Караваевых", "Му-му" и "Чайхана"), 2 пиццеррии ("Домино'с пицца" и "Додо пицца"), а также булочная ("Буханка") и заведение быстрого питания ("Хинкальная")

Больше всего сетевых заведений (из ТОП-15) расположено в Центральном административном округе (более 200 заведений). Примерно одинаковое количество (около 80) в Западном, Северном, Северо-Восточном, Южном и Восточном административных округах. Самое маленькое количество в Северо-Западном административном округе.

Рассмотрим какие административные районы Москвы присутствуют в датасете.

Больше всего заведений в Центральном административном районе. Более чем в 2 раза больше, чем в остальных районах. Меньше всего заведений в Северо-Западном административном округе.
В Центральном административном районе самая популярная категория заведений - ресторан. Затем идут кафе и кофейни.
В остальных районах самая популярная категория заведений - кафе. После кафе идут рестораны и кофейни. Меньше всего во всех районах булочных и столовых.

Визуализируем распределение средних рейтингов по категориям заведений.

Самый высокий средний рейтинг у баров (4.39). Затем идут пиццерии, рестораны, кофейни и булочные (средний рейтинг 4.3 - 4.27). Ниже средний рейтинг столовых (4.21) и кафе (4.12). Самый низкий рейтинг у предприятий быстрого питания - 4.05

Построим фоновую картограмму (хороплет) со средним рейтингом заведений каждого района.

Самый высокий средний рейтинг в заведениях Центрального и Северного административных округов. Самый низкий средний рейтинг заведений Юго-Восточного административного округа

Отобразим все заведения датасета на карте с помощью кластеров средствами библиотеки folium.

Самое большое количество заведений расположено в центре Москвы.

Найдем топ-15 улиц по количеству заведений и построим график распределения количества заведений и их категорий по этим улицам.

Самое большое количество заведений на проспекте Мира. Самые многочисленные категории: кафе, рестораны и кофейни. В ТОП-15 улиц по количеству заведений ожидаемо попали самые длинные улицы Москвы.

Найдем улицы, на которых находится только один объект общепита.

Улиц на которых расположен только один объект достаточно много - 457. Посмотрим визуализацию на карте.

Улицы с одним заведением расположены достаточно равномерно по всей Москве. Явных закономерностей в расположении не прослеживается.

Посчитаем медиану столбца middle_avg_bill (значения средних чеков заведений) для каждого района. Построим фоновую картограмму (хороплет) с полученными значениями для каждого района.

Самые большие значения среднего чека в центре Москвы, а также в Западном административном округе.
Самые низкие значения среднего чека в Юго-Западном, Северо-Восточном и Юго-Восточном административных округах.

Вывод.

Проведен анализ данных. Установлено следующее:

Детализируем исследование: открытие кофейни

Основателям фонда «Shut Up and Take My Money» не даёт покоя успех сериала «Друзья». Их мечта — открыть такую же крутую и доступную, как «Central Perk», кофейню в Москве. Будем считать, что заказчики не боятся конкуренции в этой сфере, ведь кофеен в больших городах уже достаточно. Попробуем определить, осуществима ли мечта клиентов. Ответим на следующие вопросы:

Посмотрим сколько всего кофеен в датасете? В каких районах их больше всего, каковы особенности их расположения?

Посмотрим где они располагаются.

Отметим на карте Москвы распределение количества кофеен в каждом районе.

Больше всего кофеен в Центральном административном округе. 30% от общего количества кофеен в Москве. Меньше всего в Северо-Западном административном округе.

Есть ли круглосуточные кофейни?

Круглосуточные кофейни существуют. Таких кофеен всего 4.18% от общего количества.

Посмотрим на карте, где расположены круглосуточные кофейни.

Самое большое количество круглосуточных кофеен находится в центре Москвы. Но есть и в отдалении от центра, преимущественно на крупных улицах.

Практически все круглосуточные кофейни - сетевые. Несетевых всего 9 из 59.

Какие у кофеен рейтинги? Как они распределяются по районам?

Самые высокие рейтинги у кофеен, расположенных в Центральном и Северо-Западном административных округах.
Самые низкие рейтинги у кофеен, расположенных в Западном и Северо-Восточном административных округах.

На какую стоимость чашки капучино стоит ориентироваться при открытии и почему?

Самые высокие медианные цены чашки каппучино в Западном, Центральном и Юго-Западном административных округах.

При выборе стоимости чашки капучино в новой кофейне, стоит ориентироваться на стоимость чашки в соседних заведениях. Если капучино будет стоить дороже, то высокая цена может отпугнуть посетителей.

Рекомендации для открытия новой кофейни:

1) Расположение – Центральный или Западный административный округ. В Центральном административном округе самая большая проходимость и самые высокие цены. В Западном административном округе также высокие цены, а рейтинги кофеен низкие. Таким образом, если открыть хорошую кофейню, то она может стать очень популярной на фоне остальных.

2) Режим работы – некруглосуточный. Круглосутчных кофеен очень мало, так как у посетителей, как правило, нет необходимости собираться с друзьями ночью. Или зайти ночью по пути на работу, с работы или в обеденный перерыв. Так что нужно придерживаться обычного дневного графика работы.

3) Стоимость чашки капучино при открытии не должна превышать 190 рублей для Центрального и Западного административных округов. Если капучино будет стоить дороже обычной (медианной) цены в районе, то высокая цена может отпугнуть посетителей на этапе начала работы.

4) Тип кофейни – несетевая. Кофеен в Москве очень много. Создание собственной, неповторимой кофейни может привлечь посетителей при большом количестве заведений такого же типа в округе.

5) Количество посадочных мест около 80 (допустимый диапазон 40 - 140 мест). Нужно руководствоваться типичными для кофеен значениями количества посадочных мест.

Вывод.

Проведен анализ кофеен в Москве. Установлено следующее:

Общий вывод.

Цель исследования - найти особенности рынка заведений общественного питания Москвы.

Результат исследования поможет в выборе подходящего места для открытия заведения общественного питания в Москве.

Исследование проводится на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года.

Данные moscow_places.csv загружены. Установлено, что:

Проведена предобработка данных:

Проведен анализ данных. Установлено следующее:

Проведен анализ кофеен в Москве. Установлено следующее:

Подготовлены рекомендации для открытия новой кофейни в Москве: